35 research outputs found

    Parallel texts alignment

    Get PDF
    Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia InformáticaAlignment of parallel texts (texts that are translation of each other) is a required step for many applications that use parallel texts, including statistical machine translation, automatic extraction of translation equivalents, automatic creation of concordances, etc. This dissertation presents a new methodology for parallel texts alignment that departs from previous work in several ways. One important departure is a shift of goals concerning the use of lexicons for obtaining correspondences between the texts. Previous methods try to infer a bilingual lexicon as part of the alignment process and use it to obtain correspondences between the texts. Some of those methods can use external lexicons to complement the inferred one, but they tend to consider them as secondary. This dissertation presents several arguments supporting the thesis that lexicon inference should not be embedded in the alignment process. The method described complies with this statement and relies exclusively on externally managed lexicons to obtain correspondences. Moreover, the algorithms presented can handle very large lexicons containing terms of arbitrary length. Besides the exclusive use of external lexicons, this dissertation presents a new method for obtaining correspondences between translation equivalents found in the texts. It uses a decision criteria based on features that have been overlooked by prior work. The proposed method is iterative and refines the alignment at each iteration. It uses the alignment obtained in one iteration as a guide to obtaining new correspondences in the next iteration, which in turn are used to compute a finer alignment. This iterative scheme allows the method to correct correspondence errors from previous iterations in face of new information

    Translation Alignment and Extraction Within a Lexica-Centered Iterative Workflow

    Get PDF
    This thesis addresses two closely related problems. The first, translation alignment, consists of identifying bilingual document pairs that are translations of each other within multilingual document collections (document alignment); identifying sentences, titles, etc, that are translations of each other within bilingual document pairs (sentence alignment); and identifying corresponding word and phrase translations within bilingual sentence pairs (phrase alignment). The second is extraction of bilingual pairs of equivalent word and multi-word expressions, which we call translation equivalents (TEs), from sentence- and phrase-aligned parallel corpora. While these same problems have been investigated by other authors, their focus has been on fully unsupervised methods based mostly or exclusively on parallel corpora. Bilingual lexica, which are basically lists of TEs, have not been considered or given enough importance as resources in the treatment of these problems. Human validation of TEs, which consists of manually classifying TEs as correct or incorrect translations, has also not been considered in the context of alignment and extraction. Validation strengthens the importance of infrequent TEs (most of the entries of a validated lexicon) that otherwise would be statistically unimportant. The main goal of this thesis is to revisit the alignment and extraction problems in the context of a lexica-centered iterative workflow that includes human validation. Therefore, the methods proposed in this thesis were designed to take advantage of knowledge accumulated in human-validated bilingual lexica and translation tables obtained by unsupervised methods. Phrase-level alignment is a stepping stone for several applications, including the extraction of new TEs, the creation of statistical machine translation systems, and the creation of bilingual concordances. Therefore, for phrase-level alignment, the higher accuracy of human-validated bilingual lexica is crucial for achieving higher quality results in these downstream applications. There are two main conceptual contributions. The first is the coverage maximization approach to alignment, which makes direct use of the information contained in a lexicon, or in translation tables when this is small or does not exist. The second is the introduction of translation patterns which combine novel and old ideas and enables precise and productive extraction of TEs. As material contributions, the alignment and extraction methods proposed in this thesis have produced source materials for three lines of research, in the context of three PhD theses (two of them already defended), all sharing with me the supervision of my advisor. The topics of these lines of research are statistical machine translation, algorithms and data structures for indexing and querying phrase-aligned parallel corpora, and bilingual lexica classification and generation. Four publications have resulted directly from the work presented in this thesis and twelve from the collaborative lines of research

    Artefactos do Paleolítico superior da Gruta do Escoural (Montemor-o-Novo, Évora)

    Get PDF
    A colecção de artefactos agora dada a conhecer, demonstra a presença de actividade humana, durante o Paleolítico superior, no interior da Gruta do Escoural, aspecto que as manifestações artísticas ali descobertas, de carácter mágico-religioso, bem confirmam.A sua atribuição ao Paleolítico superior, mais especificamente ao Solutrense superior, conforme indica a morfologia do fragmento da "folha de salgueiro" e, eventualmente, ao Magdalenense final, a atendermos aos paralelos que sustentam tanto os fragmentos de zagaia,como a falange de Cervus perfurada ou talvez, ainda, a conta de Littorina obtusata, acompanha a cronologia conferida ao santuário rupestre. A escassez de indústrias atribuíveis ao Paleolítico superior deve-se ao facto de as zonas interiores das cavidades subterrâneas não terem sido habitualmente habitadas pelo Homem que, em certos casos e como aconteceu na Gruta do Escoural, as elegeram para cenário de actividades conotadas com a superstrutura sagrada e de que tanto as pinturas como as gravuras ali detectadas como, possivelmente, os artefactos agora publicados são testemunho.info:eu-repo/semantics/publishedVersio

    Dois artefactos de osso, pós-paleolíticos, da Gruta do Escoural (Montemor-o-Novo, Évora)

    Get PDF
    O estudo dos dois artefactos ósseos, agora dados a conhecer, provenientes da Gruta do Escoural, permite considerar uma ocupação daquela cavidade natural durante o Neolítico final, como indica a tipologia do alfinete, possivelmente dando continuidade à necrópole ali instalada anteriormente (Neolítico médio). A este mesmo período pertencerão, ainda, alguns vasos de cerâmica, nomeadamente um esférico com carena alta.info:eu-repo/semantics/publishedVersio

    Desilusão

    Get PDF
    ARTE E CULTURA VISUAL é uma revista do Centro de Investigação e de Estudos em Belas-Artes (CIEBA), com a periodicidade de um número anual, a sair no final de cada ano. O âmbito a que se dedica é, como o título faz antever, as artes plásticas e a cultura visual, procurando um discurso reflexivo, diverso, actual, problematizante e orgânico, que permita conferir enfoque aos dispositivos da arte e das imagens artísticas na sua ontologia e nos seus contextos – pontuais ou sistémicos – históricos, culturais, estéticos, institucionais, sociais, e, inclusivamente, económicos e políticos. Centrando- se neste campo de pensamento – e as imagens assumem também uma forma de pensamento –, a revista convoca pensadores pluridisciplinares e artistas que desejem partilhar a sua reflexão e a sua obra. Cada número é dedicado a um tema. Este número é dedicado à DESILUSÃO. Desilusão reporta-se a uma sensação de desapontamento, a um sentimento de frustração ou de decepção. Naturalmente, que este desapontamento implica que antes a si existiu, de alguma forma, uma expectativa, eventualmente uma ilusão, que, por conseguinte, não foi cumprida. Depois do alívio da pandemia, de repente, a guerra foi outra. A Rússia invadia a Ucrânia em Fevereiro. Perdem-se vidas, comentem-se abusos de variada ordem. A guerra seguiu-se à peste, como se voltássemos à Idade Média, a um lugar que nos parecia distante, superado. A desilusão pode, contudo, não se limitar à guerra. Este número de Arte e Cultura Visual procura explorar e interpelar este conceito na sua plural abrangência e significado.info:eu-repo/semantics/publishedVersio

    Literacia em saúde mental de adolescentes e jovens: Conceitos e desafios

    Get PDF
    A literacia em saúde entendida enquanto constelação de competências cognitivas, sociais e capacidades que permitem aos indivíduos aceder, compreender e usar informação no domínio da saúde, tem ao longo da última década sido perspetivada como dimensão fundamental para os programas de promoção da saúde e prevenção das doenças mentais. Neste artigo é apresentado e analisado criticamente o conceito de literacia em saúde e literacia em saúde mental, discutindo a sua abrangência e aplicabilidade, de acordo com os desafios emergentes e que se colocam aos programas de educação e sensibilização para a saúde mental de adolescentes e jovens. Porque a literacia tem tanto de relevância quanto de complexidade (Nutbeam, 2009), apresenta-se também um modelo de literacia em saúde, bem como os principais conceitos com este relacionado, nomeadamente: educação para a saúde, promoção da saúde e comunicação em saúde. Debate-se ainda a extensibilidade desta temática no âmbito das novas ferramentas ao serviço da promoção da saúde como é o caso da web e do seu potencial e utilidade no incremento da literacia em saúde mental de adolescentes e jovens.ABSTRACT: Health literacy, understood as a constellation of cognitive and social skills and competences that allow individuals to access, understand and use information in the health domain, has been, during the last decade, viewed as a fundamental dimension of health promotion and mental illness prevention programmes. In this article, the health literacy concept and mental health literacy are presented and critically analyzed, discussing their scope and applicability, in terms of the emerging challenges that are placed on mental health education and sensitization programs for teenagers and young people. Because literacy is as relevant as it is complex (Nutbeam, 2009), a health literacy model is also presented, as well as the principal concepts related to it, namely: health education, health promotion and health communication. The extension of this theme to the area of new tools at the service of health promotion is also debated, as in the case of the Web and its potential and utility in increasing the mental health literacy of teenagers and young people.RESUMEN: La literacía de la salud se entiende como siendo el conjunto de habilidades cognitivas, sociales y capacitaciones que les permiten a las personas acceder, comprender y utilizar la información en el área de la salud. Esta ha sido enfocada en la última como siendo una dimensión fundamental en los programas de promoción de la salud y de prevención de enfermedades mentales. Este artículo presenta y analiza críticamente el concepto de literacía de la salud y de la salud mental, y razona su alcance y su aplicabilidad, en consonancia con los desafíos emergentes y aquellos que se les colocan a los programas de educación y sensibilización sobre la salud mental de adolescentes y jóvenes. Ya que la literacía tiene tanta importante como complejidad (Nutbeem, 2009), se presenta también un modelo de literacía de la salud, así como aquellos conceptos clave relacionados con ella, es decir: la educación para la salud, la promoción y la comunicación de la salud. Se cuestiona, asimismo, la capacidad de ampliación de esta cuestión en el contexto de las nuevas herramientas para la promoción de la salud, tales como Internet, y su potencial y utilidad en la mejora de los conocimientos sobre la salud mental de los adolecentes y jóvenes

    Mapping density, diversity and species-richness of the Amazon tree flora

    Get PDF
    Using 2.046 botanically-inventoried tree plots across the largest tropical forest on Earth, we mapped tree species-diversity and tree species-richness at 0.1-degree resolution, and investigated drivers for diversity and richness. Using only location, stratified by forest type, as predictor, our spatial model, to the best of our knowledge, provides the most accurate map of tree diversity in Amazonia to date, explaining approximately 70% of the tree diversity and species-richness. Large soil-forest combinations determine a significant percentage of the variation in tree species-richness and tree alpha-diversity in Amazonian forest-plots. We suggest that the size and fragmentation of these systems drive their large-scale diversity patterns and hence local diversity. A model not using location but cumulative water deficit, tree density, and temperature seasonality explains 47% of the tree species-richness in the terra-firme forest in Amazonia. Over large areas across Amazonia, residuals of this relationship are small and poorly spatially structured, suggesting that much of the residual variation may be local. The Guyana Shield area has consistently negative residuals, showing that this area has lower tree species-richness than expected by our models. We provide extensive plot meta-data, including tree density, tree alpha-diversity and tree species-richness results and gridded maps at 0.1-degree resolution
    corecore